Optimización offline regularizada con creencia bayesiana híbrida posterior Nuevo método unifica incertidumbre epistémica y de modelo en RL offline. Optimización regularizada con creencia bayesiana híbrida. 2026-06-02 · 2 min